Project information

Implementasi Naive Bayes Pada Studi QSAR

Pada penelitian ini, menggunakan metode Random Forest untuk melakukan seleksi fitur berdasarkan dataset yang tersedia. Random forest merupakan pengembangan dari Decision Tree dengan menggunakan beberapa Decision Tree, dimana setiap DecisionTree telah dilakukan training menggunakan sampel individu dan setiap atribut dipecah pada tree yang dipilih antara atribut subset yang bersifat acak. Dan pada proses klasifikasi, individunya didasarkan pada vote dari suara terbanyak pada kumpulan populasi tree. Random Forest yang dihasilkan memiliki banyak tree, dan setiap tree ditanam dengan cara yang sama. Tree dengan variabel x akan ditanam sejauh mungkin dengan tree dengan variabel y. Dan dalam perkembangannya, sejalan dengan bertambahnya data set, maka tree pun ikut berkembang. Penempatan tree yang saling berjauhan membuat apabila terdapat tree disekitar tree x berarti pohon tersebut merupakan perkembangan dari tree x. Beberapa fungsi learning yang dihasilkan random forest digunakan strategi ensemble ”bagging” untuk mengatasi masalah overfitting apabila dihadapkan data set yang kecil. Dalam penelitian ini, model Random Forest menggunakan seluruh fitur dan entri dalam dataset yaitu terdiri dari 34 atribut yang mana memiliki 1626 data entri.